# 2. 数据预处理
# 2.1 将颜色（分类特征）转换为数值

#导入包
from sklearn.preprocessing import LabelEncoder

# 对颜色列进行编码
encoder_color = LabelEncoder()
df['颜色编码'] = encoder_color.fit_transform(df['颜色'])

# 查看编码映射（可选）
print("颜色编码映射:", dict(zip(encoder_color.classes_, encoder_color.transform(encoder_color.classes_))))


#2.2 特征标准化（可选，根据模型需求）

#导入包
from sklearn.preprocessing import StandardScaler

# 标准化大小和颜色编码
scaler = StandardScaler()
X_scaled = scaler.fit_transform(df[['大小(cm)', '颜色编码']])